查看原文
其他

语音的故事(六十三)| 焦磊:语图仪和可视语言(连载)

甘于恩 语言资源快讯
2024-09-12

   


由于微信公众号推出新功能,”语言资源快讯”左边显示的名称并非原作者,而是公众号管理者,原作者将于大标题和文末显示,感谢各位读者的谅解!

 

(各种型号的语图仪)


有了傅立叶分析这样一件利器,反映时间-振幅变化的声波就可以被转换为反映时间-频率变化的频谱。通过语音分析软件,我们又可以将这种频谱显示在屏幕上或是画在特定的胶片上。这样我们就有了一种得把媒介为声波的语言转换为可视图像的方法。这种方法的发明大约在1941年左右,当时由于战争的需要,美国军方希望发明一种可以把声音转换为可视图像的装置。从而开展了一系列关于这方面的研究,但当时的这类研究主要是为了军事目的,而且被作为军方机密,严加保管。直到二战结束之后,在这一方面的研究才得到公开并可以用于民用项目。很快,有些研究者们找到了它的新用途:他们认为,这项技术可以有助于聋哑人与正常人之间的远距语音交流。只要能够教会聋哑人阅读语音图,就可以让聋哑人和正常人通过电话交谈。因此,人们用老贝尔那套帮助聋哑人学语言的语音字母的名字来命名这项技术,称之为“可视语言”。

虽然在频谱图上显示出来的每个单词,其图形都不一样。但同一个词,即使说话者不同,其图形仍然具有很大的相似。也就是说,一个单词在语言中表现为特定的音组,而在频谱图上同样表达为特定的图像组,而且图像组和音节组是一一对应的。这就是频谱的阅读原理。尽管研究者们很早就发现了这个原理,但直到1943年才开始了对于如何阅读这类频谱图的系统研究。当时,研究者们面对三个问题:一,不同的语音是如何在语图中被表达的;二,相同的音是如何被区别的;三,哪些特征才是能够帮助识读的。为了解决这三个问题,研究者录制了男女发音人的英语基本发音各一套,以及基本发音的各类不同组合,并将语图与同一时间时的发音器官运动图相对照。

同时,研究者们也成立了一个实验小组,找了七位听觉正常的青年女性作为培训对象。由原来的频谱图研究者们负责教授她们如何阅读频谱上显示的语音。之所以选择听觉正常的人进行实验培训,是出于两个方面的考虑:第一,研究者并不知道这项技术对于聋人来说是否便于掌握,可能聋人在读语图方面的能力也不理想,因此没必要先冒这个险;第二,这项技术也需要培养一批未来的教学者,而教学者自然是以听觉正常者为佳。

培训班的课程安排是每天两个小时,其中一个小时讨论语音学的原理,而另一个小时则学习如何阅读频谱。课外另外安排一个小时作为练习。剩余的时间由研究者们进行录音,并准备新的教学材料。一开始的时候,学习进度非常缓慢,因为从来没有过这方面的先例可循。研究者需要辨别,语图上哪些特征对于识别来说是重要的,而哪些可有可无。从而根据研究的进度来调整教学。而且当时的技术还并不先进,每一幅语图需要数分钟的时间才能烧制完成。到了1944年的时候,发明了一种用于课堂教学的语图仪,可以即时将语音转换为语图,并显示在屏幕上。语图从屏幕的右端出现,缓缓向左端推移,识读时的顺序则是从左到右。这种仪器的发明提高了识别的效率。也促进了课程的改革。据当事人的回忆,上课的情形基本上是这样的:大家围着语图仪的屏幕坐着,然后其中的两名学员则站在教室后面的暗室里面,对着话筒说话。于是语图在屏幕上不断显示出来,大家就根据语图判断暗室里的人到底说了什么。当出现问题的时候,负责教授的研究人员则打断讨论并予以讲解。教室的布置很有讲究,室内的亮度,椅子的高度和观看屏幕的角度对识读语图都会有影响,因此这些问题都在实验人员的考虑范围之中。虽然识读语图是一件需要聚精会神的很辛苦的事儿,但学员们在休息时尽管很累,仍然兴致勃勃地聊个不停。到了一年之后,整个组都能够流利识读语图了。

尽管这次实验性的训练很成功,但研究者还不是很确定它是否能够成为聋人用于电话交流的一个辅助装置。于是,一名聋人工程师加入了学习班。在此之前,他已经熟练地掌握了读唇语的技术,并且获得了机械学的硕士学位。研究者都希望通过他的加入,能够更好地改进教学与仪器设备。虽然他本人对一个“聋人辅助计划”没有多大兴趣,但还是加入了这个班级。而当他发现可视语言的潜在可能性的时候,他的兴趣被激发了。他学得很快。而这个实验小组也给他提供了一个打电话的机会。在1945年2月2日,他打出了世界上第一个由聋人打出的电话,而在1945年8月28日的时候,他接到了世界上第一个由聋人接听的电话。

实验证明教学非常有效,聋人和正常人在学习可视语言方面的进度差不多,通过90个小时的学习,就能使人掌握约300个英语词汇。这种增长是持续的,那位聋人工程师接受了约200个小时的训练,掌握了800个词汇。只需一年的学习,任何人都可以熟练地使用可视语言来进行电话联络了。

然而这项技术最终并没有被用于电话,或许是由于科技发展日新月异,尤其当互联网发展起来之后,文字图像的传输变成一件非常容易的事儿,聋人们也不必费心去学什么可视语言了。然而语言学家们开始注意到这项语音分析技术在语言学研究上的巨大潜力。语音学的科学分类应当建立在语图的基础上。正是在这个背景之下,1952年美国语言学家罗曼·雅各布森,莫里斯·哈雷和瑞典工程师古纳·方特发表了宏文《语音分析初探》,将语音单位分析为十二组特征,并将特征与语音的声学特性对应起来,实现了语音学与音系学的完美结合,而这项工作正是在语音频谱图的基础上完成的。

 

罗曼·雅各布森(Roman Jakobson,1896—1982),杰出的语言学家,诗学家,莫斯科语言小组的主持人,后移居捷克斯洛伐克,二战期间移居美国并加入美国籍


莫里斯·哈雷(Morris Halle), 美国麻省理工学院语言学教授。1923 年出生于拉脱维亚,生成音系学先驱

现在,语图已经变成了语音学家分析语音所不可少的重要工具,而电脑技术的进步使得语图的完成变得轻而易举。现在语音学家只需要打开电脑,将一个录制好的声音文件导入语音分析程序就可以得到一张长度不限的清晰的语图。这是哪怕二十年前的语音学家们都不敢想象的事儿。现在最有名的语音分析工具是美国KAY公司的CSL系列,它包括了一套声学器材,以及配套的软件与插件。利用这套工具我们可以进行各类不同的语音声学分析。

然而一些商业公司的软件售价昂贵,不要说个人,就算是国内一般的语音学实验室也难以负担。因此,世界上的很多语音学家已经开始转用另一套免费的语音分析程序,它的名字叫做Praat,这个词在荷兰语中是说话或交谈的意思。其作者是荷兰阿姆斯特丹大学人文学院语音科学研究所的主席保罗·博尔斯马(Paul Boersma)教授和大卫·威宁克(David Weenink)助教授。Praat最早的版本发布于1993年。起初用户还无法自由地下载使用,但从2003年6月5日的4.1版起,作者取消了专门的授权并开放了绝大部分源代码。进一步,从2004年3月4日的4.2版起,作者开放了全部源代码,使Praat成为公开的软件。相隔短则一天,长则月余,作者就会发布最近修订的版本,消除旧的故障,增添新的功能。


语音分析程序Praat的开发者之一、暨南大学汉语方言研究中心特聘研究员大卫·威宁克(David Weenink)教授(荷兰阿姆斯特丹大学)在方言中心授课



 (Praat语音分析软件的主界面)


现在Praat已成为全世界实验语音学、心理语言学、语言教学、语言调查、自然语言处理等相关领域的高校教师、学生和其他研究人员普遍选用的专业软件。Praat的普及,终结了从事实验语音学特别是声学语音学研究必须依赖价格昂贵的实验仪器的时代,许多语音学实验室不再使用各种陈旧的语图仪,而仅仅配置有安装了Praat等软件的个人计算机和灵敏的麦克风作为必备的器材。如果读者有兴趣,可以自行往http://www.fon.hum.uva.nl/praat/网址下载最新版本的praat,并试着用它制作一些语图。中文版操作手册则可以参照http://praatman.googlepages.com/的徐清白翻译版,或者中国社科院熊子瑜的操作手册。


(大卫·魏宁克教授主讲第四期汉语方言语言记录与分析研修班(2016年3月,暨南大学),结业合影留念)

(熊子瑜,中国社科院语言研究所研究员,语音研究室主任,中国社会科学院大学语言学系硕士硕士生导师,暨南大学汉语方言研究中心兼职研究员)




(原载《叫我如何不想她——语音的故事》,朱晓农、焦磊著,商务印书馆2013年第一版)



END

本期编辑:范兰兰

本期审读:姚洛

责任编辑:甘于恩

图片:来源于网络

投稿邮箱:jnufyzx@163.com

版权归语言资源快讯所有,转载请标明出处。


往期回顾

语音的故事(六十二)| 焦磊:数学家傅立叶(连载)

语音的故事(六十一)| 焦磊:水是眼波横:横波与纵波(连载)

语音的故事(六十)| 焦磊:贝尔的故事:从电话到浪纹计(连载)




做语言资源保护公众号不容易,每天更新公众号更不容易,而每天提供新语料尤其不容易。很多读者还没养成打赏习惯,提倡每个月打赏一元钱,积少成多,我们的事业就有希望。谢谢各位!


继续滑动看下一个
语言资源快讯
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存